P-hacking

p-hacking, jinak známý jako data dredging, data fishing, data snooping, data butchery, significance chasing, significance questing nebo selective inference, je užívání analýzy dat za účelem cíleného hledání výsledků či korelací, které potvrdí nějakou hypotézu. Tím se rapidně zvyšuje možnost tzv. falešně pozitivního výsledku zkoumání.[1]

Získávání těchto výsledků se dosahuje například zahrnováním pouze těch dat z celého experimentu, která se hodí pro potvrzení hypotézy. Vypouští se tedy podstatná část všech získaných dat a tím  je ovlivňován zkoumaný vzorek. Další situace, kdy k p-hackingu dochází, nastává v případě, že se vypočtená p-hodnota všech zkoumaných dat výrazně blíží předem stanovené hranici p-hodnoty, ale nedostává se pod ní. Pouhé přidání dalšího množství dat do celkové analýzy často vede k pokoření této hranice, a tedy k zdánlivému zisku statisticky významného výsledku.[2]

  1. STARBUCK, William H. 60th Anniversary Essay: How Journals Could Improve Research Practices in Social Science. Administrative Science Quarterly. 2016, roč. 61, čís. 2, s. 165–183. Dostupné online [cit. 2021-11-19]. ISSN 0001-8392. 
  2. NUZZO, Regina. Scientific method: Statistical errors. Nature. 2014-02-13, roč. 506, čís. 7487, s. 150–152. Dostupné online [cit. 2021-11-19]. ISSN 0028-0836. DOI 10.1038/506150a. (anglicky) 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search